《Journal of Biophotonics》丨基于拉曼光谱技术与深度学习结合的病原菌快速检测

2023-01-13

2022年12月,中科院长春光机所李备研究员团队与重庆医科大学第一附属医院陈雪萍团队应用长光辰英核心产品——P300共聚焦拉曼光谱仪在《Journal of Biophotonics》期刊上发表了题为“Classification of pathogenic bacteria by Raman spectroscopy combined with variational auto-encoder and deep learning”的论文。本研究提出了一种将拉曼光谱与VAE和LSTM相结合的病原体分类新方法(VAE-LSTM)。在单细胞水平上收集了大量病原体的拉曼光谱,并使用VAE生成了大量无法与真实光谱区分的拉曼光谱,用于训练LSTM并生成分类模型。该方法可大大减少拉曼光谱的采集次数。此外,联合使用VAE和其他深度学习模型来提高分类的准确性。该不仅在病原菌种水平上有很好的分类效果,在株水平上分类效果也十分显著,并对临床菌株进行测试,仍能达到很好的分类效果。

1673590364462727.png



一、研究背景

快速和早期的病原体鉴定是指导抗生素治疗的关键。拉曼光谱作为一种非侵入性诊断技术,可以快速、准确地检测病原体。单细胞的拉曼光谱是细胞的“指纹”,揭示了细胞的代谢特征。通过拉曼光谱和深度学习相结合,可以实现病原体的快速鉴定。传统的分类技术往往需要大量的数据进行训练,收集拉曼光谱需要大量的时间。






二、 研究内容

本研究提出了一种将拉曼光谱与VAE和LSTM相结合的病原体分类新方法(VAE-LSTM)。在单细胞水平上收集了大量病原体的拉曼光谱,并使用VAE生成了大量无法与真实光谱区分的拉曼光谱,用于训练LSTM并生成分类模型。该方法可大大减少拉曼光谱的采集次数。此外,联合使用VAE和其他深度学习模型来提高分类的准确性。

1673590426939067.jpg

图1. 基于VAE-LSTM的拉曼光谱识别框架和模型结构。

VAE-LSTM由VAE模块和LSTM模块组成。A)VAE模块由编码器和解码器组成;B) LSTM模块由三层组成。


(1)首先为了获得训练数据,我们使用P300共聚焦拉曼光谱仪获得了20组病原体的拉曼光谱(图2)。结果显示,5组病原体的拉曼光谱形状和峰值强度相似,仅靠简单观察很难区分病原体。

1673590496665673.png

图2.20种致病菌的拉曼光谱。拉曼光谱系统对每个菌株至少获得200个光谱。


(2)我们比较了真实谱和生成谱的信噪比(图3A),发现信噪比得到了提高。以肺炎克雷伯菌为例,我们使用K-Nearest-Neighbors (KNN)对真实谱和生成谱进行分类(图3B),结果显示两者很难区分。同时,我们使用PCA降维和t分布随机邻居嵌入(t-SNE)降维来更好地比较真实频谱和生成频谱之间的差异。结果表明,实际光谱和生成光谱的分布非常相似(图3C, 3D)。

1673590523535865.jpg

图3. A)每种病原体原谱和生成谱的信噪比箱图;B) KNN算法对肺炎克雷伯菌真实谱和生成谱进行分类;C)主成分分析降维结果;D) t-SNE降维结果。


(3)我们使用训练好的VAE-LSTM分类模型,根据测试数据集中的菌群来识别每个微生物细胞的物种。训练后的VAE-LSTM分类模型预测测试数据集中的每个分支组,并将其分配到一个物种类别。采用VAE-LSTM分类模型对不同微生物种进行分类,平均准确率为96.9%。为了验证该模型在临床样本中的稳健性和适用性,我们用不同于训练样本的菌株验证了该模型的准确性。混淆矩阵如图6C所示,大肠杆菌、粪肠杆菌和铜绿假单胞菌的准确率均达到100%。

1673590554619559.jpg

图4. VAE-LSTM模型识别结果。A)菌株水平的16种致病菌混淆矩阵;B)五种致病菌的种级混淆矩阵;C) 4个未参与训练的临床数据作为独立验证数据集的混淆矩阵。






三、结论

我们提出了一种结合拉曼光谱、VAE和LSTM来识别病原体的新方法,该方法不仅在病原菌种水平上有很好的分类效果,在株水平上分类效果也十分显著。与几种广泛应用的深度学习分类技术进行比较,结果表明VAE与LSTM相结合可以提高细菌预测的准确性。利用VAE和LSTM对单细胞拉曼光谱进行分类快速、有效、准确。

与其他免培养方法(如荧光标记、磁标记、单细胞测序等)相比,拉曼光谱技术可以在不需要专门标记的情况下识别细菌,并且可以直接适应其他样品。只要对其在病原体鉴定中的使用进行轻微调整,我们的方法就可以适用于其他光谱技术(如质谱和红外光谱)和材料鉴定问题。未来,我们将继续开发新的算法,提高光谱生成速度和精度以及分类精度,并将其与排序技术(如光镊技术、激光诱导前向转移技术)相结合,对单细胞进行识别和排序。

使用我们通过融合拉曼光谱与VAE和LSTM开发的技术,可以快速识别患者样本中的每个细胞,大大降低了分类模型开发所需的样本数量。有了这种技术,细菌疾病可以在数小时内得到准确和具体的治疗,减少医疗支出和抗生素的过度使用,同时还可以防止抗生素耐药性的发展。


文章链接:

https://doi.org/10.1002/jbio.202200270


  • 电话:0431-81077008   0571-86972756
  • 邮箱:sales@hooke-instruments.com
关注我们
0431-81077008
Copyright © 2022
长春长光辰英生物科学仪器有限公司
吉ICP备18001354号-1